APIs de IA del mercado (agosto 2025)

Precios por 1 millón de tokens (USD), modalidades soportadas y señales prácticas para decidir. **Revisa siempre la documentación oficial antes de comprar.**

Modelos “directos” (proveedores principales)

Proveedor Modelos representativos (2025) Precio entrada
USD / 1M tokens
Precio salida
USD / 1M tokens
Contexto máx. Modalidades Fortalezas Regla de pulgar (eficiencia)
OpenAI GPT-5 GPT-5 mini / nano GPT-4o desde $1.25 (GPT-5) · $0.25 (mini) desde $10 (GPT-5) · $2.00 (mini) · $20 (4o) hasta 400K (GPT-5) Texto, imagen; (audio/video con 4o y Realtime) Razonamiento y código de alto nivel; ecosistema maduro; herramientas integradas Generalista premium: GPT-5 = alta calidad por $/salida moderado; 4o = mejor latencia/multimodal
Google (Gemini) Gemini 2.5 Pro Gemini 2.5 Flash / Flash-Lite Pro: $1.25 (≤200k) / $2.50 (>200k)
Flash: $0.30 · Flash-Lite: $0.10
Pro: $10 (≤200k) / $15 (>200k)
Flash: $2.50 · Flash-Lite: $0.40
2M (Pro) · 1M (Flash) Texto, imagen, audio, video; Live API Ventanas gigantes y buen costo en Flash; “grounding” con Google Search Volumen & contextos largos: Flash/Flash-Lite maximizan $/token; Pro para tareas complejas con 2M
Anthropic Claude Sonnet 4 Claude Haiku 3.5 Sonnet 4: $3 · Haiku 3.5: $0.80 Sonnet 4: $15 · Haiku 3.5: $4 200K (serie Claude 4) Texto e imagen (entrada); texto (salida) Baja alucinación, seguridad/guardrails; batch y prompt caching claros Calidad/seguridad: Sonnet 4 rinde muy bien en tareas críticas; Haiku = costo mínimo
Cohere Command R+ Command R Aya Expanse R+: $2.50 · R: $0.50 · Aya: $0.50 R+: $10 · R: $1.50 · Aya: $1.50 No publicado (varía por despliegue) Texto; (visión/otras según modelo) Enfoque enterprise, despliegues privados y compliance Empresa: buena relación costo/seguridad; R+ compite en razonamiento a menor $ que Sonnet
Notas rápidas: los precios pueden cambiar por región, proveedor y modalidad (batch, cachés, “grounding”, etc.). Valores mostrados son por 1M tokens (entrada/salida). “Contexto” = ventana máx. de tokens que el modelo puede considerar en una solicitud.

Plataformas agregadoras (multi-modelo)

Azure OpenAI / Azure AI Foundry

Catálogo con OpenAI (y otros como Mistral, xAI, Meta, Cohere). Precios por token similares a los del proveedor, con opciones de Data Zones, SLAs empresariales, y residencia de datos.

El precio exacto depende del modelo/sku y región; revisar tabla oficial de Azure.

AWS Bedrock

Acceso a Anthropic, Meta, Cohere, Mistral y más. Se cobra por token (según modelo) y opcionalmente por Flows ($0.035 por 1.000 transiciones de nodo). Excelente para integrarlo con stack AWS.

Los precios varían por modelo y por si usas Provisioned Throughput.

Cómo decidir (ultra-resumen)

EscenarioRecomendación rápida
Mejor calidad general / agentes y códigoGPT-5 (OpenAI). Si tu app es intensiva en contexto multimodal en tiempo real, evalúa GPT-4o.
Contextos gigantes al menor costoGemini 2.5 Flash (precio ultra bajo) o 2.5 Pro si necesitas 2M tokens.
Riesgo regulatorio / guardrails estrictosClaude Sonnet 4 por robustez y controles; batch y prompt caching reducen coste.
Privacidad y despliegue corporativoCohere Command R+ o consumir vía Azure/Bedrock por residencia de datos/SLA.

Glosario express